eSOLHotel: Generación de un lexicón de opinión en español adaptado al dominio turístico

نویسندگان

  • M. Dolores Molina-González
  • Eugenio Martínez-Cámara
  • Maria Teresa Martín-Valdivia
  • Salud M. Jiménez Zafra
چکیده

Since Web 2.0 is the largest container for subjective expressions about different topics or issues expressed in all languages, the study of Sentiment Analysis has grown exponentially. In this work, we focus on Spanish polarity classification of hotel reviews and a new domain-dependent lexical resource (eSOLHotel) is presented. This new lexicon has been compiled following a corpus-based approach. We have carried out several experiments using an unsupervised approach for the polarity classification over the category of hotels from corpus SFU. The results obtained with the new lexicon eSOLHotel outperform the results with other general purpose lexicon.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Anotación automática de datos acerca de la reputación de los políticos en redes sociales

Resumen. Recientemente, la minerı́a de opinión en Twitter, por medio de la Recuperación de Información (RI) y del Procesamiento de Lenguage Natural (PLN) atrajo interés en la investigación polı́tica. Sin embargo, la obtención de datos anotados de dominio especı́fico sigue siendo un paso manual muy costoso. Además, la cantidad y calidad de estas anotaciones pueden ser crı́ticas en relación al rendim...

متن کامل

Matxin-Informatika: versión del traductor Matxin adaptada al dominio de la informática

Desarrollo de un corpus de postedición para su uso en postedición estadística Recopilación de corpus paralelo ● Del dominio de la informática ● Creado en la localización de Sw Tratamiento del corpus ● Analizado, lematizado y procesado con Giza++ ● Para cada lema (es) se extraen: ● sus posibles traducciones (eu) ● y su probabilidad Uso ● Reordenación de equivalencias en 444 entradas del lexicón ...

متن کامل

Detección de subjetividad en noticias en línea publicadas en español utilizando clasificadores probabilísticos

Resumen. Los textos periodísticos pueden clasificarse dentro del llamado género informativo si su contenido se orienta a la objetividad (descripción de los hechos ocurridos), o en el género de opinión, si incluye elementos subjetivos (como el punto de vista o ideología del autor de la nota). Uno de los problemas que se presenta en la redacción de noticias es que en las notas de tipo informativo...

متن کامل

Sistema automático para la clasificación de la opinión pública generada en Twitter

Resumen. La facilidad de acceso a la diversidad de contenidos hace de Twitter un medio para pronunciarse sobre temas actuales o eventos en tiempo real. Los usuarios de esta red no cumplen únicamente una función pasiva de recepción y consumo de información, sino que al mismo tiempo se convierten en productores de contenidos. El estudio de tuits requiere de una disciplina que permita trabajar con...

متن کامل

Producción del LEL en un Dominio Técnico. Informe de un caso

El presente trabajo se centró en las actividades de la fase de elicitación de requerimientos, utilizándose para la misma una metodología basada en el uso del Léxico Extendido del Lenguaje (LEL) y Escenarios. Se utilizó como caso de estudio el Sistema de Registración y Producción del Instituto de Hemoterapia de la provincia de Buenos Aires. Las experiencias existentes de construcción se desarrol...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 54  شماره 

صفحات  -

تاریخ انتشار 2015